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编者 按 ” 随 着 大 数据 与 人 工 智能 (Al) 技术 的 飞速 发 展 ， 人 类 正 迎 来 新 一 轮 科 技 革 命 与 产业 变革 。 深 度 学 习 等 技术 近年 来 
的 突破 ， 也 使 Al 在 数学 、 物 理学 、 化 学 、 生 物 学 、 材 料 学 、 制 药 等 自然 科学 和 高 技术 领域 的 得 到 了 广泛 应 用 并 取 
得 了 令 人 瞩目 的 重大 成 果 。Al 的 快速 发 展 为 人 类 的 科学 研究 工具 和 组 织 模式 的 效率 提升 提供 了 新 机 遇 ， 以 AlphaFold2 和 
ChatGPT 为 代表 的 智能 工具 ， 展 现 出 了 超越 人 类 解决 复杂 问题 的 能 力 。 趋 势 表明 ，Al for Science 正在 成 为 一 种 新 的 科 下 
范式 。 智 能 时 代 已 经 到 来 ， 科 研 范 式 与 形态 的 变革 刻不容缓 ， 我 们 必须 把 握 机 遇 ， 积 极 应 对 。 为 此 , 《中 国 科 学 院 院 刊 》 
特 组 织 策划 专题 “大力 推 进 科 研 范 式 变 革 ， 本 专题 由 《中 国 科学 院 院 刊 》 副 主编 、 中 国 工 程 院 院 主 、 中 国 科学 院 计算 反 
术 研究 所 李 国 杰 研 究 员 指导 推进 。 
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智能 化 科研 (AI4R): 
第 五 科研 范式 


李 国 杰 
中 国 科学 院 计算 技术 研究 所 ”北京 ”100190 


摘要 文章 将 “智能 化 科研 ”(AI4R) 称 为 第 五 科研 范式 ,概括 它 的 一 系列 特征 包括 : (1) 人 工 智能 (AT) 
全 面 融 入 科学 、 技 术 和 工程 研究 ， 知 识 自动 化 ， 科 研 全 过 程 的 智能 化 ; (2) 人 机 智能 融合 ， 机 器 涌现 的 智能 
成 为 科研 的 组 成 部 分 ; G) 有 效应 对 计算 复杂 性 非常 高 的 组 合 爆炸 问题 ; (4) 面向 非 确定 性 问题 ， 概 率 统计 
模型 在 科研 中 发 挥 更 大 的 作用 ; (5) 跨 学 科 合作 成 为 主流 科研 方式 ， 实 现 前 4 种 科研 范式 的 融合 ; (6) 科研 
更 加 依靠 以 大 模型 为 特征 的 科研 大 平台 等 。 文 章 指出 科研 的 智能 化 是 一 场 科 技 上 的 革命 ， 它 带 来 的 机 遇 和 挑 
战 将 深刻 影响 中 国 科技 发 展 的 前 途 ， 呼 吁 各 行业 的 科学 家 本 身 实现 智能 化 转型 。 


天 键 词 ”智能 化 科研 ， 涌 现 ， 组 合 爆炸 问题 ， 非 确定 计算 ， 大 科学 模型 ， 科 研 大 平台 
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专题 : 大 力 推进 科研 范式 变革 


1 智能 化 科研 (AI4R): 概念 的 提出 


人 类 早期 的 科研 活动 至 少 可 以 追溯 到 公元 前 6 志 
纪 的 古 希腊 ， 以 亚 里 士 多 德 、 欧 几 里 得 为 代表 的 思想 
家 和 科学 家 作出 了 重要 贡献 。 现 代 科 学 研究 开始 于 16 
一 17 世纪 的 科学 人 革命， 伽利略 、 牛 顿 是 现代 科学 研究 
的 蜡 祖 。20 世 纪 中 叶 以 前 的 几 百 年 闻 ， 科 学 研究 的 方 
法 只 有 两 种 : CD 基于 观察 和 归纳 的 实验 研究 (第 一 范 
x); O 基于 科学 假设 和 逮 辑 演绎 的 理论 人 研究 (第 二 
范式 )。 电 子 计算 机 流行 以 来 ， 计 算 机 对 复杂 现象 的 
仿真 成 为 第 3 种 科研 方式 (第 三 范式 )。 由 于 互联 网 的 
普及 引发 数据 爆炸 ， 近 20 年 来 出 现 了 数据 密集 型 科学 
研究 方式 〈 第 四 范式 )。 

2007 年 1 月 ， 图 灵 奖 得 主 吉 姆 格雷 (Jim Gray) 
在 他 生前 最 后 一 次 演讲 中 ， 描 绘 了 关于 科学 研究 第 四 
范式 的 愿景 。 他 的 报告 题目 是 “eScience: 科学 方法 
的 一 次 革命 "， 他 把 数据 密集 型 科研 看 成 eScience 的 组 
成 部 分 之 一 ， 主 要 强调 数据 的 管理 和 共享 ， 基 本 上 不 
涉及 人 工 智 能 (AD 技术 在 科研 中 的 作用 站。“ 大 数 
据 ” 形 成 热潮 以 来 ， 数 据 驱 动 的 科研 越 来 越 受 到 重 
视 。 但 单纯 的 数据 驱动 有 明显 的 局 限 性 ， 模 型 驱动 与 
数据 驱动 一 样 重要 ， 两 者 需要 融合 。 


办 了 第 667 次 香山 科学 会 议 , 会 后 在 《中 国 科 学 院 院 
刊 》2020 年 第 12 期 发 表 了 《数据 科学 与 计算 智能 : 内 
涵 、 范 式 与 机 遇 》 综 述 论文 ， 文 章 中 明确 提出 要 开启 
“第 五 范式 ”科学 研究 ， 指 出 “第 五 范式 ”不 仅仅 是 
传统 的 科学 发 现 ， 更 是 对 智能 系统 的 探索 和 实现 ， 强 
调 人 脑 与 计算 机 的 有 机 融合 ， 并 预言 再 过 10 一 20 年 ， 
“第 五 范式 ”可 能 逐步 成 为 科学 研究 的 主流 范式 
gie. 

现在 还 很 难 对 第 五 科研 范式 做 出 严格 定义 ， 但 其 
特征 已 逐步 显露 出 来 ， 概 括 起 来 包括 以 下 6 点 : (DA 
工 智能 全 面 融 入 科学 、 技 术 和 工程 研究 ， 知 识 自动 
化 ， 科 研 全 过 程 智能 化 ; @ 人 机 融合 ， 机 器 涌现 智能 
成 为 科研 的 组 成 部 分 ， 瞳 知识 和 机 器 猜想 应 运 而 生 ; 
O 以 复杂 系统 为 主要 研究 对 象 ， 有 效应 对 计算 复杂 性 
非常 高 的 组 合 爆炸 问题 ，@ 面向 非 确 定性 问题 ， 概 率 
和 统计 推理 在 科研 中 发 挥 更 大 的 作用 ; O 跨 学 科 合 作 
成 为 主流 科研 方式 ， 实 现 前 4 种 科研 范式 的 融合 ， 特 
别 是 基于 第 一 性 原理 的 模型 驱动 和 数据 驱动 的 融合 ; 
(6) 科研 更 加 依靠 以 大 模型 为 特征 的 大 平台 ， 科 学 研究 
与 工程 实现 密切 结合 等 。 

鄂 维 南 等 科学 家 将 “AI for Science” P% P 
学 智能 ”， 这 个 术语 已 经 开始 流行 ， 可 作为 第 五 科研 


“科学 范式 ”(scientific paradigm) 是 托马斯 * 库 
恩 中 在 其 名 车 《科学 革命 的 结构 》 中 首先 使 用 的 术语 ， 
主要 是 指 各 个 学 科 在 一 定 历 史 时 期 形成 的 对 某 种 专业 
知识 的 见解 与 共识 。 现 在 这 个 术语 已 成 为 很 流行 的 热 
i, 含义 已 经 汉化 。 本 文 讨论 的 “科研 范式 ”是 指 从 
宏观 角度 看 到 的 科学 研究 方式 。 近 几 年 来 ,不 少 学 者 
开始 倡导 第 五 科研 范式 。 曾 经 大 力 宣传 第 四 科研 范式 
的 微软 研究 院 最 近 也 在 提倡 第 五 科研 范式 ， 成 立 了 新 
f] Al4Science 研究 中 心 "。2019 年 11 月 ， 笔 者 发 起 举 


范式 定名 与 翻译 的 借鉴 ， 但 智能 化 的 科研 不 限于 基础 
科学 研究 ， 也 包括 技术 研究 和 工程 研究 的 智能 化 。 科 
学 技术 部 和 国家 自然 科学 基金 委员 会 启动 部 署 的 “AI 
for Science” 专 项 称 为 “人 工 智能 驱动 的 科学 研究 ”， 
但 在 与 实验 、 理 论 、 计 算 机 仿真 、 数 据 驱 动 等 范式 名 
称 放 在 一 起 时 ， 又 显得 不 够 精炼 。 在 以 上 基础 上 ， 本 
文 将 第 五 科研 范式 称 为 “智能 化 科研 ”(AI for 
Research， 简 称 “AI4R”)， 文 字 相 对 精炼 一 些 ， 内 容 
更 广泛 ,含义 也 更 深刻 。 


CD 因数 字 4 的 英文 发 音 与 英文 单词 for 相 同 ,故而 在 “AI for Science” 中 ,以 数字 4 来 代替 英文 单词 for, 从 而 表示 为 “AI4Science”， 


简写 为 “AI4S”。 
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智能 化 科研 (AI4R): 第 五 科研 范式 


2 智能 化 科研 (AI4R) : 成 功 案例 


数据 驱动 研究 方式 往往 足够 快 但 不 够 精确 ; 而 基 
于 第 一 性 原理 的 理论 推演 和 计算 方式 算得 准 但 不 够 
快 ， 只 能 处 理 小 规模 的 科学 问题 。 近 几 年 ， 人 工 智 能 
技术 在 生物 、 材 料 、 制 药 等 领域 的 科学 研究 中 得 到 广 
iz MU, AIR 既 可 以 提高 科研 效率 ， 又 能 保证 科研 
要 求 的 精确 性 ， 成 为 科学 研究 的 强大 推动 力 ? 。AI4R 
的 成 功 案例 很 多 ， 本 文 介 绍 与 中 国 科学 院 计 算 技 术 研 
究 所 (以 下 简称 “计算 所 ”) 有 关 的 3 个 案例 。 

(1) 蛋白 质 三 维 结构 预测 。 利 用 深度 学 习 技 术 预 
测 蛋 白质 的 三 维 结构 是 AI4R 的 里 程 碑 式 的 科研 成 果 。 
到 目前 为 止 ，AlphaFold 2 已 预测 了 超过 100 万 个 物种 
的 2.14 亿 个 蛋白 质 三 维 结构 ， 几 乎 涵盖 了 地 球 上 所 有 
已 知 的 蛋白 质 。AlphaFold 2 不 仅 是 结构 生物 学 领域 的 
颠覆 性 突破 ， 更 重要 的 意义 是 消除 了 科学 家 对 人 工 智 
能 认识 上 的 障碍 ， 照 亮 了 AI4R 前 进 的 道路 。 过 去 即 
使 计算 机 科学 家 非常 精确 地 预测 了 蛋白质 三 维 结构 ， 
也 只 认为 是 所 谓 “ 干 实验 ”成 果 ， 必 须要 生物 学 家 做 
了 “ 湿 实 验 ” 以 后 才 会 接受 。 现 在 生物 学 家 已 能 够 相 
信人 工 智能 的 预测 ， 这 是 科学 界 的 跨 时 代 进 步 。 在 
AlphaFold 2 推出 以 前 ,计算 所 在 和 蛋白质 三 维 结构 预测 
方面 就 曾经 做 出 过 国际 领先 的 科研 成 果 。 

(2) 分 子 动力 学 模拟 。 中 美 合作 的 深度 势能 团队 
采用 全 新 的 “基于 深度 学 习 的 分 子 动力 学 模拟 ”研究 
方法 ,将 具有 第 一 性 原理 精度 的 分 子 动力 学 模拟 规模 
扩展 到 1 亿 个 原子 ,计算 效率 提升 1000 倍 以 上 。 这 是 
国际 上 首次 实现 智能 超 算 与 物理 模型 相 结 合 ， 引 领 了 
科学 计算 从 传统 的 计算 模式 朝 着 智能 超 算 方 向 前 进 。 
此 论文 的 第 一 作者 贾 伟 乐 目 前 在 计算 所 工作 。2022 


年 ， 他 将 分 子 动力 学 的 计算 规模 提升 至 170 亿 个 原子 ， 
计算 模拟 的 速度 提高 7 倍 ， 一 天 能 够 模拟 11.2 纳 秒 的 
物理 过 程 ， 比 2020 年 获得 戈 登 ， 贝尔 奖 的 成 果 又 提升 
1 一 2 个 数量 级 。 

(3) 芯片 全 自动 设计 。2022 年 5 月 ， 计 算 所 成 功 
利用 人 工 智能 技术 设计 出 全 球 首 款 全 自动 生成 的 32 位 
第 五 代 精 简 指令 集 (RISC-V) 中 央 处 理 器 (CPU) 
一 一 “启蒙 1 号 ”。 设计 周期 缩短 至 传统 设计 方法 的 1/ 
1000， 仅 用 5 小 时 就 生成 了 400 万 逻辑 门 ?。 这 一 创新 
成 果 是 人 工 智能 在 复杂 的 工程 设计 领域 取得 的 重大 突 
破 ， 预 示 着 “AI for Technology” 与 “AI for Science" 
一 样 ， 具 有 十 分 光明 的 前 途 。CPU 设计 的 准确 率 要 达 
到 99.999 999 999 99% (13 个 91) 以 上 ; 而 车 采用 神 
经 网 络 方法 ， 包 括 最 近 很 热门 的 大 语言 模型 ， 都 无 法 
保证 精度 。 计 算 所 陈云 老 团 队 发 明了 用 二 进 制 推 测 图 
(BSD) 来 表示 电路 逻辑 的 新 方法 ， 可 以 将 一 般 布 尔 函 
数 的 描述 复杂 度 从 指数 级 降 到 多 项 式 级 。“ 启 蒙 1 号 ” 
的 一 个 重要 发 现 是 ， 不 只 是 基于 神经 网 络 的 语言 大 模 
型 ， 类 似 决 策 树 的 BSD 也 具有 涌现 功能 。 这 一 意外 的 
发 现 引 发 了 人 们 对 神经 网 络 之 外 的 智能 技术 的 期 盼 ， 
只 要 模型 足够 复杂 ， 其 他 的 人 工 智 能 技术 也 可 能 涌现 
出 意 想 不 到 的 功能 。 


3 智能 化 科研 (AIAR): 向 智能 时 代 迈 进 中 
出 现 的 新 科研 范式 


科研 范式 随 着 人 类 生产 力 的 进步 不 断 演变 。 农 业 
时 代 只 有 第 一 范式 ， 工 业 时 代 开 始 流行 第 二 范式 ， 信 
息 时 代 出 现 第 三 和 第 四 范式 。 现 在 人 类 处 于 信息 时 代 
的 智能 化 阶段 ， 正 在 向 智能 时 代 迈 进 ， 智 能 化 科研 范 
式 顺 应 而 生 。 


(2) Xu Y J, Liu X, Cao X, et al. Artificial intelligence: A powerful paradigm for scientific research. (2021-09-28)[2023-12-26]. https:// 


doi.org/10.1016/j.xinn.2021.100179. 


(3) Cheng S Y, Jin P W, Guo Q, et al. Pushing the limits of machine design: Automated CPU design with AI. (2023-06-27) [2023-12- 


26]. http://arxiv.org/abs/2306.12456.pdf. 
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专题 : 大 力 推进 科研 范式 变革 


从 1936 年 图 灵 提 出 计算 模型 开始 ， 计 算 机 科学 技 
术 已 经 研究 80 多 年 了 。 现 在 大 家 普遍 认为 ， 所 有 的 计 
算 机 都 是 图 灵机 的 实现 ， 其 实 图 灵 模 型 主要 是 用 来 研 
究 计算 的 不 可 判定 性 。1943 年 麦 卡 洛 克 (McCulloch) 
和 皮 茨 (Pitts) 提出 了 神经 元 计算 模型 ， 这 个 模型 在 
可 计算 性 上 与 图 灵 模 型 是 等 价 的 ， 但 对 自动 机 理论 而 
言 ， 可 能 比 图 灵 模 型 更 有 价值 。 冯 “' wise HEB : 
“图 灵机 和 和 神经 网 络 模型 分 别 代表 了 一 种 重要 的 研究 
方式 : 组 合 方 法 和 整体 方法 。McCulloch 和 Pitts 对 底层 
的 零件 作 了 公理 化 定义 ， 可 以 得 到 非常 复杂 的 组 合 结 
构 ; 图 灵 定 义 了 自动 机 的 功能 ， 并 没有 涉及 到 具体 的 
TR." 这 两 条 技术 路 线 一 直 在 竞争 ， 尽 管 神经 网 络 
模型 受到 排挤 打压 ， 但 相关 学 者 始终 没有 停止 研究 。 
一 直到 2012 年 ，Hinton 等 学 者 发 明 的 深度 学 习 方 法 在 
ImageNet 图 像 识别 比赛 中 一 鸣 惊 人 ， 神 经 网 络 模型 才 
一 下 子 红 火 起 来 。 

现在 流行 的 神经 网 络 模型 与 McCulloch 和 Pitts 提 
出 的 模型 并 没有 实质 性 的 改变 ， 能 在 图 像 、 语 音 识别 
和 自然 语言 理解 上 取得 重大 突破 ， 除 了 采用 反 向 传播 
和 梯度 下 降 算 法 外 ， 主 要 是 数据 量 大 了 几 个 数量 级 ， 
计算 机 的 算 力也 增强 了 几 个 数量 级 ， 量 变 引 起 了 质 
变 。 冯 : 诺 伊 曼 的 著作 《 自 复制 自动 机 理论 》" 中 指 
出 ,“ 自 动机 理论 的 核心 概念 在 于 复杂 性 ， 超 复杂 的 
系统 会 涌现 出 新 的 原理 ”， 并 提出 一 个 重要 概念 一 一 
复杂 度 冰 值 。 低 于 复杂 度 阔 值 的 系统 ， 就 会 无 情 地 误 
退 耗 散 ， 突 破 了 复杂 度 阔 值 的 系统 ， 就 会 由 于 在 数据 
层 的 扩散 和 变异 作用 而 不 断 进 化 ， 可 以 做 很 困难 的 
事情 口 。 

现在 的 神经 网 络 模型 有 数 千 亿 甚 至 上 万 亿 参 数 ， 


O 冯 : 诺 依 曼 去 世 后 由 亚 瑟 . 伯 克 斯 于 1966 年 整理 完成 。 


可 能 已 接近 能 处 理 困难 问题 的 复杂 度 阔 值 点 。 神 经 网 
络 不 是 按照 确定 的 算法 实现 图 灵 计 算 ， 其 主要 功能 是 
“猜测 加 验证 "。 现 在 流行 的 卷 积 神经 网 络 能 够 用 于 猜 
下 一 个 字 是 什么 。 猜 测 和 计算 是 两 个 不 同 的 概念 ， 基 
于 神经 网 络 的 机 带 更 合适 的 名 称 是 “猜测 机 ”， 而 不 
是 “计算 机 ”， 其 解决 复杂 问题 的 效率 大 大 高 于 图 灵 
模型 。 神 经 网 络 模型 只 是 人 工 智能 众多 模型 中 的 一 
种 ， 只 要 蜂 过 复杂 度 阔 值 点 ， 其 他 人 工 智能 模型 也 有 
可 能 表现 出 超 乎 寻常 的 功能 。 智 能 化 科研 就 是 要 让 各 
种 人 工 智 能 技术 在 科研 工作 中 大 放 异 彩 。 

人 工 智 能 技术 经 过 60 多 年 的 沉淀 和 积累 ， 在 数据 
和 算 力 均 足 够 丰富 的 条 件 下 ， 已 经 成 为 推动 科研 和 生 
产 的 利 咒 ， 爆 发 出 前 所 未 有 的 能 量 。 尽 管 实现 真正 的 
通用 人 工 智 能 还 要 走 很 长 的 路 ， 但 毫 无 疑问 ， 智 能 化 
已 经 成 为 当今 时 代 的 主要 追求 。 对 时 代 的 认识 不 能 犯 
错误 ， 错 过 时 代 转 变 机 遇 将 遭受 历史 性 的 降 维 打击 。 


4 智能 化 科研 (AI4R) 的 标志 : 机 器 涌现 智 
能 ， 人 机 物 智能 融合 


第 五 科研 范式 的 标志 性 事件 是 ， 在 AlphaFold 2 实 
现 蛋白 质 结构 预测 和 后 来 GPT4 表 现 出 的 令 人 惊艳 的 
功能 中 ， 机 器 猜想 都 发 挥 了 关键 作用 ， 说 明 大 规模 的 
机 器 学 习 神 经 网 络 已 涌现 出 某 种 程度 的 认 知 智能 > 。 
尽管 开发 者 并 不 能 完全 解释 机 器 的 认 知 智能 是 如 何 产 
生 的 ， 但 实践 已 证 明 ， 在 很 多 应 用 中 ， 机 器 的 猜测 是 
正确 的 。 人 造 的 硅 基 产品 涌现 出 超出 常规 计算 和 信息 
处 理 的 认 知 智能 ， 这 是 一 个 划时代 的 变化 ”。 

所 谓 “ 涌 现 ”"， 是 指 系统 中 的 个 体 遵循 简单 的 规 
则 ， 通 过 局 部 的 相互 作用 构成 一 个 整体 时 ， 一 些 意 想 


© 张 平 .AI 何以 涌现 :复杂 适应 系统 视角 的 ChatGPT 和 大 语言 模型 . (2023-03-11) [2023-12-26]. https://www. sohu. com/a/ 


652716004 121124373. 


(6 祁 晓 亮 . 人 工 智 能 的 黎明 :从 信息 动力 学 的 角度 看 ChatGPT. (2023-06-01) [2023-12-26]. https://it. sohu.com/a/681255835 - 


121124373. 
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智能 化 科研 (AI4R): 第 五 科研 范式 


不 到 的 属性 或 者 规律 会 突然 在 系统 层面 出 现 ， 即 “ 系 
统 定量 上 的 变化 可 以 导致 系统 行为 上 的 定性 变化 ”。 
生命 的 形成 ， 蚁 群 、 鸟 群 的 群体 性 行为 ， 人 脑 的 知 
慧 ， 人 类 许多 社会 行为 等 都 源 自 “涌现 ”。 人 们 和 常 说 ， 
21 世 纪 是 “复杂 性 科学 的 世纪 ”， 而 “涌现 ”就 是 复 
杂 性 科学 最 关注 的 主题 。 美 国 圣 塔 非 研 究 所 1984 年 就 
开始 探索 科学 和 社会 中 的 涌现 行为 ， 试 图 创造 一 种 统 
一 的 复杂 科学 理论 来 解释 “涌现 ”， 但 至 今 揭 示 “ 消 
现 ”的 机 理 仍 然 是 一 个 开放 性 的 科学 问题 只 。 

机 需 具 有 人 类 解释 不 清楚 的 “ 暗 知识 ”， 这 对 我 
们 曾经 固有 的 认识 论 是 一 次 巨大 的 冲击 。 有 些 学 者 认 
为 ,计算 机 只 能 机 械 地 执行 人 编写 的 程序 ， 不 可 能 
智能 。 但 上 千 亿 自动 生成 的 参数 构成 的 人 工 神经 网 络 


i 

不 是 程序 员 编 程 时 直接 输入 的 ， 是 机 带 学 习 形成 的 复 

RACHA. MARMARA, AAAH, 
机 有 机 “ 智 "”。 人 机 互补 是 第 五 科研 范式 的 主要 特征 
之 一 ， 今 后 要 争取 做 到 人 类 和 人 工 智 能 “各 显 其 智 ， 
Ag 3e" Ul, 

这 里 所 说 的 “机 顺 的 认 知 能 力 ” 不 同 于 人 的 认 知 
能 力 ,“ 机 需 理 解 ” 也 不 同 于 人 的 理解 。 所 谓 “ 机 需 
理解 ”是 指 ， 如 果 机 需 通过 学 习 形 成 某 些 规则 ， 可 以 
实现 一 个 符号 空间 到 意义 空间 的 映射 ， 就 说 它 对 符号 
空间 具有 一 定 的 理解 能 力 。 例 如 ， 机 带 翻 译 可 以 不 懂 
语义 ,但 能 将 中 文 “ 映 射 ”到 其 他 语言 ， 哪 怕 是 没有 
接触 过 的 小 语种 。 人 工 智 能 天 气 预报 模型 可 以 不 懂 气 
象 理 论 ， 但 能 做 出 比 数值 天 气 预 报 还 精确 的 预报 。 这 
可 能 是 一 种 新 颖 的 “理解 ”形式 ， 一 种 能 够 实现 预测 
的 理解 形式 。 如 同 我 们 可 以 说 飞机 具有 与 鸟 类 不 同 的 
飞行 能 力 一 样 ， 不 必 纠 缠 机 带 的 “理解 ”是 否 与 人 类 
一 样 。 理 解 和 意识 有 不 同 层次 的 内 涵 ， 有 理解 能 力 未 
必 有 自我 意识 。 将 理解 能 力 与 自我 意识 剥离 ， 有 助 于 
降低 人 们 对 人 工 智能 莫名 其 妙 的 忍 惧 。 对 机 器 学 习 形 
成 的 大 模型 是 否 会 具有 类 似 人 脑 的 涌现 能 力 ， 不 同 的 


学 者 有 不 同 的 判断 。Hinton 等 学 者 始终 坚信 ， 人 工 神 
经 网 络 的 神经 元 虽然 简单 ， 但 复杂 的 机 融 学 习 网 络 与 
人 类 的 大 脑 有 某 种 程度 的 相似 性 。 正 是 由 于 少数 有 前 
瞻 眼 光 的 科学 家 的 这 一 份 坚信 ， 默 默 耕 耘 几 十 年 ， 才 
达成 今天 人 工 智能 技术 的 大 突破 。 笔 者 曾 问 过 
ChatGPT 和 “ 文 心 一 言 ":“ 机 需 是 不 是 真 的 具有 智 
能 ?”ChatGPT 回答 :“ 机 需 确 实 拥 有 自己 的 智能 ”。 
“ 文 心 一 言 ”回答 :“ 目 前 的 主流 观点 认为 ， 机 天 暂时 
没有 真正 的 智能 。” 机 器 的 回答 与 创建 者 选择 学 习 内 
容 的 意向 有 关 ， 也 许 ， 中 美 两 国学 者 对 机 带 智 能 的 不 
同 认识 是 导致 我 们 在 大 模型 研发 上 落后 的 背后 原因 
itus 


5 智能 化 科研 (AIAR) 的 主要 目标 : 有 效应 
对 难 解 的 组 合 爆炸 问题 


传统 科学 不 但 能 揭示 自然 界 的 一 些 奥 秘 ， 而 且 和 全 
解决 很 多 困难 的 工程 问题 ， 例 如 大 飞机 的 制造 。 一 架 
大 飞机 有 数 百 万 个 零 部 件 ， 因 为 我 们 明白 每 个 零件 的 
作用 ， 也 理解 它 的 整个 系统 的 空气 动力 学 原理 ， 其 复 
杂 性 已 经 在 我 们 的 掌握 之 中 。 但 对 于 大 脑 ， 即 使 我 们 
理解 了 每 一 个 神经 元 ， 仍 然 不 能 解释 意识 和 智慧 是 如 
何 产生 的 ， 因 为 复杂 系统 的 功能 和 性 质 并 不 是 其 组 成 
部 分 的 线性 之 和 四 。 在 生物 、 化 学 、 材 料 、 制 药 等 许 
多 领域 ， 科 学 问题 中 假设 空间 非常 大 ， 例 如 小 分 子 候 
选 药物 的 数量 佑 计 有 10" 种 ， 可 能 成 为 稳定 材料 的 总 
TAE 10 7 种， 逐个 筛选 完全 不 可 行 。 这 就 是 我 们 稼 
说 的 “组 合 爆炸 ”， 数 学 家 称 之 为 “维度 灾难 "。 我 们 
有 了 打开 科学 大 门 的 钥匙 ， 却 没有 力气 把 沉重 的 大 门 
帮 开 。 经 过 300 多 年 的 科学 探索 ， 知 识 之 树 底 层 的 果 
实 差不多 都 摘 光 了 ， 留 在 树 尖 的 果实 几乎 都 是 难 哺 的 
复杂 之 果 。 过 去 4 种 科研 范式 难以 解决 的 组 合 爆炸 问 
是 第 五 范式 的 主要 用 武之 地 。 

人 工 智能 的 目标 不 是 一 味 地 模拟 语音 、 视 觉 、 语 
言 等 人 类 自身 的 基本 技能 ， 而 是 要 让 人 工 智 能 拥有 和 
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专题 : 大 力 推进 科研 范式 变革 


人 类 一 样 认识 世界 和 改造 世界 的 能 力 。 人 脑 中 并 没有 
确定 性 的 算法 ， 而 是 采用 抽象 、 模 糊 、 类 比 、 近 似 等 
非 确定 的 方法 来 降低 认 知 的 复杂 性 。 汉 “ 诺 伊 曼 品 早 
就 预言 , “信息 理论 包括 两 大 块 : 严格 的 信息 论 和 概 
率 的 信息 论 。 以 概率 统计 为 基础 的 信息 理论 大 概 对 于 
现代 计算 机 设计 更 加 重要 。” 近 几 年 机 器 学 习 的 巨大 
进步 ， 主 要 是 采用 了 概率 统计 模型 ， 对 我 们 不 完全 了 
解 的 问题 进行 建 模 分 析 。 机 器 学 习 提供 了 跨 尺 度 建 模 
的 工具 ， 能 跨越 所 有 物理 尺度 进行 建 模 和 计算 ， 通 过 
试 错 和 调整 ， 不 断 完善 所 获得 的 结果 ， 追 求 统计 意义 
上 最 终结 果 的 可 接受 性 。 统 计 意 义 的 正确 性 与 确定 性 
计算 程序 的 严格 正确 性 是 解决 复杂 问题 的 不 同 思路 。 
人 工 智能 研究 的 新 近 发 展 体现 一 种 趋势 ， 放弃 绝对 
性 ， 拥 抱 不 确定 性 ， 即 只 求 近似 解 或 满足 一 定 精度 的 
解 。 这 或 许 是 这 次 人 工 智 能 “意外 ”取得 成 功 的 深层 
原因 。 

我 们 把 第 五 科学 范式 称 为 智能 化 科研 ， 原 因 之 一 
就 是 ， 只 有 突破 还 原 论 和 经 典 计算 范式 的 思想 机 锁 ， 
采用 智能 化 的 新 范式 ， 才 能 应 对 输入 、 输 出 和 求解 过 
程 的 不 确定 性 。 问 题 的 复杂 性 随 计算 模型 的 改变 而 改 
ARo ARTA DRY NP 困难 问题 是 对 图 灵 计 算 模 型 而 言 
的 。 自 然 语言 理解 、 模 式 识别 等 NP 困难 问题 在 大 模 
型 上 能 有 效 解决 ， 说 明 大 语言 模型 (LLM) 对 这 类 问 
题 的 求解 效率 远 远 超过 图 灵 计 算 模 型 。AI4R 的 成 功 本 
质 上 不 是 大 算 力 出 奇迹 ， 而 是 改变 计算 模型 的 胜利 。 

解决 复杂 度 不 高 的 问题 ， 人 们 追求 采用 “ 白 盒 模 
型 ”， 强 调 可 解释 性 。 但 对 于 非常 复杂 的 问题 ， 短 期 
内 难以 获得 “ 白 盒 模型 ”。 科 学 研究 可 以 被 视 为 将 
“ 黑 盒 模型 ”转化 为 “ 白 盒 模型 ”的 过 程 ， 即 从 对 某 
现象 或 过 程 不 了 解 逐步 推进 到 充分 理解 其 内 部 机 制 和 
原理 。 智 能 化 科研 提醒 我 们 ， 一 定时 期 内 对 深度 学 习 
这 一 类 “ 黑 盒 模型 ”要 有 一 定 的 容 恳 度 ， 既 要 以 “ 实 
践 是 检验 真理 的 唯一 标准 ”为 原则 ， 承 认 “ 黑 盒 模 
型 ” 某 种 程度 的 合理 性 ， 在 其 基础 上 开展 深入 研究 ， 
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促进 科学 技术 发 展 ， 又 要 防止 潜在 的 失控 或 不 良 后 
果 ， 以 科技 伦理 监管 科研 。 


6 智能 化 科研 (AIAR) 的 重要 特征 : 平台 型 
科研 


今天 的 科研 还 需要 依靠 科技 工作 者 个 人 的 聪明 才 
智和 想象 力 ， 好 奇 心 驱动 的 科研 仍然 是 科研 的 重要 组 
成 部 分 ， 但 科研 工作 越 来 越 离 不 开 科 研 的 三 要 素 : 
质量 的 数据 、 先 进 的 算法 模型 和 强大 的 计算 能 
几 年 ， 这 3 个 要 素 的 规模 都 在 迅速 扩大 ， 大 数据 、 
模型 和 大 算 力 已 开始 构成 不 可 或 缺 的 科研 大 平台 , F 
台 型 科研 也 成 为 第 五 科学 范式 的 重要 特征 。 

ChatGPT 的 问世 掀起 了 构建 大 模型 的 热潮 ， 模 型 
的 参数 规模 已 经 远 远 超出 人 们 过 去 的 想象 。 大 模型 确 
实 涌现 了 一 些小 模型 不 具备 的 功能 和 性 能 ， 但 大 模型 
究竟 做 到 多 大 规模 才 到 尽头 ， 现 在 还 没有 定论 。 大 模 
型 必然 需要 大 算 力 ， 训 练 大 模型 需要 的 巨大 电力 引起 
了 人 们 的 担忧 ， 也 促使 科技 界 探索 大 幅度 节能 的 变革 
性 器 件 和 计算 系统 。 大 语言 模型 目前 主要 受到 企业 界 
的 青睐 ,能 不 能 把 大 语言 模型 当成 通用 的 知识 库 ， 为 
大 科学 模型 提供 一 些 基 础 的 知识 和 常识 ， 提 高 科学 大 
模型 的 泛 化 能 力 ， 是 需要 探索 的 重大 科学 问题 。 以 大 
模型 为 代表 的 人 工 智能 还 处 在 发 展 的 初期 ， 现 在 的 人 
工 智 能 计算 只 相当 于 科学 计算 的 电子 管 计 算 机 时 代 ， 
人 迫切 需要 晶体 管 和 集成 电路 式 的 重大 发 明 。 

现在 流行 的 说 法 是 “大 算 力 出 奇迹 ”， 这 种 说 法 
强调 了 模型 规模 和 数据 规模 的 作用 ， 在 一 定 程度 上 是 
正确 的 。 但 从 理论 的 角度 来 看 ， 线 性 扩展 计算 能 力 对 
扩大 可 解决 的 NP 困难 问题 的 规模 没有 本 质 性 帮助 ， 
单纯 提高 算 力 不 是 万 能 药 。 如 果 围 棋 扩 大 到 20x20 的 
棋盘 ， 只 用 在 19x19 的 基础 上 横 纵 两 边 各 多 加 1 条 线 ， 
但 野蛮 搜索 的 算 力 需要 提高 10* 倍 。 训 练 围棋 模型 搜 
索 到 的 游戏 位 置 占 所 有 可 能 游戏 位 置 的 比例 是 几乎 无 
穷 小 的 数 〈10755)。 计 算 所 全 自动 设计 CPU 的 算法 将 


也 
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几乎 无 穷 大 的 搜索 空间 压缩 到 10'。 这 些 成 功 案例 都 说 
明 ， 出 奇迹 的 真正 原因 是 压缩 搜索 空间 ， 这 是 靠 智能 
算法 和 模型 优化 ! 世界 著名 的 计算 机 科学 家 李 明 教 授 
从 第 一 性 原理 出 发 ,证 明了 “理解 就 是 压缩 ， 大 语言 
模型 本 质 上 就 是 压缩 ” “。 现 在 全 国 推出 了 几 百 个 大 
大 小 小 的 机 器 学 习 模 型 ， 但 如 果 只 是 用 小 模型 模仿 大 
模型 ， 不 在 算法 的 优化 、 模 型 的 微调 对 齐 和 数据 的 清 
洗 整 理 上 大 功夫 ， 只 会 浪费 大 量 算 力 ， 难 以 缩小 与 国 
外 的 差距 。 

目前 ， 科 技 界 对 大 模型 的 前 途 存在 两 种 争锋 相对 
的 预 判 。 以 OpenAI 公 司 为 代表 的 一 些 科学 家 认为 ， 
只 要 扩大 模型 和 数据 的 规模 ,增加 算 力 ， 未 来 的 大 模 


释 : Al-Automation of Intelligence (智能 的 自动 化 )。 
知识 获取 、 处 理 和 存储 的 自动 化 也 需要 大 平台 来 实 
现 。 建 设 全 国 规模 先进 的 科研 基础 设施 ， 需 要 充分 认 
证 、 精 心 谋划 。 其 中 ， 路 领域 的 大 科学 模型 与 垂直 领 
域 专业 模型 的 协同 配合 是 需要 考虑 的 重要 问题 。 人 工 
智能 发 展 的 历史 已 经 证 明 ， 忽 视 模 型 的 泛 化 能 力 ， 退 
回 到 过 去 的 专家 系统 是 一 条 没有 希望 的 道路 。 但 通用 
性 也 是 一 个 相对 概念 ， 人 类 本 身 也 不 具有 绝对 的 通用 
性 ， 发 展 人 工 智 能 不 必 把 理想 的 通用 性 作为 唯一 追求 
的 目标 ， 应 重视 借助 大 模型 在 一 个 行业 或 领域 内 提高 
效率 ， 降 低 成 本 。 真 正 通用 的 人 工 智 能 至 少 还 需要 20 
年 以 上 的 时 间 才 能 实现 ， 近 20 年 内 要 采取 通用 和 专用 


型 很 可 能 会 涌现 出 现在 没有 的 新 功能 ， 呈现 更 好 的 通 
用 性 。 更 多 学 者 认为 ， 大 模型 不 会 一 直 保 持 这 两 年 的 
发 展 速 度 ， 与 其 他 技术 一 样 ， 会 从 爆发 式 增长 走向 饱 
和 。 因 为 按 目前 训练 大 模型 的 算 力 3 个 月 翻 一 番 的 增 
长 速度 ， 如 果 延 续 10 年 ， 算 力 就 要 增加 1 万 亿 倍 ， 这 
是 不 可 能 发 生 的 事 。 现 在 下 结论 哪 种 预 判 正确 还 为 时 
过 早 。 大 语言 模型 可 能 不 是 实现 通用 人 工 智能 的 最 佳 
道路 ， 只 是 人 工 智能 发 展 过 程 中 的 一 个 阶段 性 技术 ， 
但 它 比 前 两 波 人 工 智能 采用 的 技术 具有 更 大 的 使 用 价 
值 。 我 国 必须 尽快 缩小 在 大 模型 科研 与 产业 化 上 与 国 
外 的 差距 ， 走 出 符合 国情 的 大 模型 发 展 之 路 ， 同 时 努 
力 探索 不 同 于 大 模型 的 人 工 智 能 新 途径 。 

第 五 科研 范式 需要 的 科研 大 平台 实际 上 是 涵盖 
科研 三 要 素 的 智能 化 科研 基础 设施 ， 除 了 共享 的 大 
科学 模型 和 工具 软件 ， 还 包括 海量 的 科学 数据 、 知 
识 库 ， 当 然 还 要 提供 统一 调度 的 算 力 。 基 于 大 平台 
的 新 科研 范式 将 降低 获取 数据 、 模 型 和 知识 的 成 本 ， 
提升 算法 和 模型 的 应 用 能 力 ， 加 速 新 知识 的 迭代 。 
麦卡锡 和 尼尔森 对 人 工 智能 (AI) 做 出 过 男 一 种 解 


并 重 的 技术 路 线 。 算 力 网 的 建设 既 要 考虑 “ 块 块 ”的 
地 域 需求 ， 也 要 考虑 “条 条 ”的 各 行业 业务 特点 ， 各 
个 不 同 的 行业 都 应 该 构成 高 效率 的 知识 和 资源 共享 的 
专业 子 网 。 


7 智能 化 科研 (AIR) 的 重要 实现 途径 : 跨 


学 科 交 叉 与 多 种 科研 范式 的 融合 


计算 科学 与 不 同学 科 的 融合 ， 正 在 驱动 一 场 科 学 
的 数字 革命 。 孤 立地 追求 单 学 科 发 展 已 经 不 合理 了 ， 
学 科 交 又 融 合 是 第 五 科研 范式 一 一 智能 化 科研 
(AI4R) 的 重要 实现 途径 之 一 。 近 百年 来 ， 学 科 越 分 
越 细 。1900 年 约 有 500 门 学 科 ，2000 年 大 约 是 5000 
门 ，100 年 增加 10 倍 。 如 果 继 续 按照 这 个 趋势 发 展 ， 
2100 年 可 能 增加 到 50000 门 。 我 国教 育 部 门 设置 的 学 
科 也 是 越 来 越 多 ， 与 学 科 融 合 发 展 的 趋势 是 否 背 道 而 
驰 ? 如 何在 推动 智能 化 科研 的 过 程 中 ， 大 力 改革 我 国 
的 科研 和 教育 ， 值 得 高 度 重 视 。 

人 工 智能 已 经 广泛 应 用 到 前 4 种 科研 范式 ， 不 论 
是 自动 化 的 实验 设备 、 计 算 机 辅助 的 理论 分 析 、 可 视 


(D Jiang Z Y, Wang R, Bu D, et al. A theory of human-like few-shot learning. (2023-01-03) [2023-12-26]. https://doi. org/10.48550/ 


arXiv.2301.01047. 
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化 的 计算 机 模拟 ， 还 是 智能 化 的 数据 挖掘 ， 人 工 智能 
技术 都 发 挥 了 关键 的 作用 。 第 五 科研 范式 并 没有 取代 
原来 的 4 种 范式 ， 只 是 在 前 4 种 范式 无 能 为 力 的 情况 
下 才 凸 显 它 的 威力 。 第 五 科研 范式 也 不 是 科研 范式 演 
进 的 终结 ， 今 后 可 能 出 现 第 六 科研 范式 、 第 七 科研 范 
式 ……。 在 第 五 科研 范式 中 ， 模 型 驱动 和 数据 驱动 深 
BE. “数据 ”和 “原理 ”可 以 相互 转化 ， 从 “ 数 
据 ” 中 可 以 提炼 出 经 验 性 “原理 ”， 也 可 以 从 第 一 性 
原理 出 发 仿真 模拟 出 高 质量 的 数据 。 现 在 各 个 领域 中 
需要 解决 的 难题 大 多 需要 人 机 交互 ， 人 在 回路 中 ， 人 
机 融合 的 具 身 智能 将 发 挥 越 来 越 大 的 作用 。 

第 五 科研 范式 还 有 一 个 特点 是 科研 与 工程 的 融 
合 。 构 建 科 研 大 平台 ， 筛 选 高 质量 的 数据 ， 将 大 模型 
做 到 极致 ， 都 需要 高 水 平 的 工程 师 。 今 天 世界 上 引领 
人 工 智 能 的 不 是 一 流 的 大 学 ， 也 不 是 国立 实验 室 ， 而 
是 OpenAI、DeepMind 这 样 的 创业 公司 。 这 些 科 研 团 
队 不 仅 具 备 前 沿 性 、 原 创 性 基础 科研 能 力 ， 还 做 了 大 
量 系统 研发 和 工程 开发 ， 而 且 具 备 开 发 技术 平台 、 研 
发 产品 、 推 进 商业 化 的 能 力 外 。 我 国 要 在 人 工 智 能 领 
域 进入 国际 第 一 方 阵 ， 需 要 集中 全 国 优势 力量 ,构建 
集 产 学 研 和 工程 开发 于 一 体 的 新 型 科研 团队 。 


8 结语 : 积极 主动 参与 到 科研 智能 化 的 革 
命中 


科研 的 智能 化 是 一 场 科 技 上 的 革命 。 它 带 来 的 机 
遇 和 挑战 将 决定 未 来 20 年 ， 中 国 在 科技 发 展 上 是 与 国 
际 先进 水 平 拉 大 差距 还 是 迎头 赶 上 。 决 定 前 途 的 不 完 
全 是 技术 上 被 人 “ 卡 脖子 ”， 而 是 我 们 自己 思想 认识 
上 的 障碍 。 有 两 种 认识 在 影响 我 们 的 决策 : (D) 认为 只 
要 是 计算 机 执行 的 软件 都 是 人 事先 编 好 的 算法 ， 所 谓 
机 器 智能 都 是 无 移 之 谈 ; © 人 工 智能 可 能 产生 人 控制 
不 了 的 风险 ， 必 须 事 先 确 定 其 产生 的 结果 是 完全 安全 
可 信 的 ， 才 能 允许 推广 使 用 。 第 1 种 认识 主要 是 来 自 
计算 机 科学 家 内 部 ， 第 2 种 认识 可 能 主要 来 自 政府 间 
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门 。 其 实 ， 计 算 机 开始 出 现 认 知 智 能 是 一 件 划 时 代 的 
重大 突破 ， 我 们 不 能 视而不见 。 机 器 产生 的 认 知 是 基 
于 随机 性 和 概率 分 布 ， 令 人 震惊 的 正确 预测 和 所 谓 
“ 纪 觉 ”是 一 个 硬币 的 两 面 ， 相 辅 相 成 。 如 果 强 行 决 
定 人 工 智 能 模型 不 允许 出 现 幻觉 ， 那 它 的 涌现 能 力也 
就 没有 了 。 我 们 必须 在 与 幻觉 共存 的 环境 下 发 展 人 工 
智能 技术 ， 发 展 与 安全 必须 双 轮 驱动 。 

所 谓 本 质 上 是 “AI for 
Scientists"。 人 工 智能 科学 家 和 工程 师 不 是 智能 化 科研 
的 主角 ， 各 行业 的 科学 家 才 是 主角 ， 因 为 各 个 领域 的 
智能 化 建 模 一 定 是 以 本 领域 的 科学 家 为 主 来 完成 。 各 
领域 的 科学 家 要 担当 起 这 份 重任 ， 自 身 需 要 智能 化 转 
型 。 如 果 科 学 家 不 懂 计 算 机 、 不 懂 人 工 智能 ， 要 推动 
AIR 就 非常 困难 。 目 前 ， 推 动 AI4R 主要 的 阻力 来 自 
科学 家 本 身 ， 因 为 还 有 不 少 科学 家 认为 智能 化 不 属于 
本 科学 的 范畴 ， 认 为 学 科 的 交叉 融合 不 是 正统 科学 。 
只 有 广大 科学 家 积极 主动 地 参与 ， 智 能 化 科研 才能 
上 健康 快速 发 展 的 轨道 。 


“AI for Science” 
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AI4R: The fifth scientific research paradigm 


LI Guojie 
(Institute of Computing Technology, Chinese Academy of Sciences, Beijing 100190, China) 

Abstract This article refers to “AI for Research ( AI4R )" as the fifth research paradigm and summarizes its characteristics, including: 
(1) the fully integration of artificial intelligence into various scientific and technology researches; (2) machine intelligence has become 
an integral part of scientific research; (3) effectively handles the combinatorial explosion problem with high computational complexity; 
(4) probability and statistical models play a greater role in scientific research; (5) realize the integration of four existing research 
paradigms, cross disciplinary cooperation has become the mainstream research method; (6) scientific research relies more on large 
research platforms characterized by large models. This article points out that AI4R is a scientific revolution, and the opportunities and 
challenges it brings will affect the future of China's science and technological development. It calls on scientists in various fields to 
achieve transformation of intelligentization. 

Keywords  AIA4R, emergence, combinatorial explosion problems, nondeterministic computing, large scientific models, scientific 
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